检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于元学习自适应的小样本语音合成

吴郅昊, 迟子秋, 肖婷, 王喆

《计算机应用》唯一官方网站 2024, 44 (5): 1629-1635. DOI: 10.11772/j.issn.1001-9081.2023050640

摘要（137）

HTML （1）

PDF （1457KB）（21）

在小样本条件下的语音合成（TTS）要求在仅有少量样本的情况下合成与原说话人相似的语音，然而现有的小样本语音合成面临如下问题：如何快速适配新说话人，并且在保证语音质量的情况下提高生成语音与说话人的相似性。现有模型在适配新说话人的过程中，很少考虑到在不同适配阶段模型特征的变化规律，导致生成语音不能在保证语音质量的情况下快速提升语音相似性。为了解决上述问题，提出一种使用元学习指导模型适配新说话人的方法，模型中通过元特征模块对适配过程进行指导，在适配新说话人过程中提升语音相似度的同时保证生成语音质量；并通过步数编码器区分不同的适配阶段，以提升模型适配新说话人的速度。在Libri-TTS与VCTK数据集上通过主观与客观评价指标，在不同的适配步数下对现有快速适配新说话人的方法进行了比较，实验结果表明所提方法动态时间规整的梅尔倒谱失真（DTW-MCD）分别为7.450 2与6.524 3，在合成语音的相似度上优于其他元学习方法，并且能够更快适配新的说话人。

图表 | 参考文献 | 相关文章 | 多维度评价